PUSA V1.0
https://yaofang-liu.github.io/Pusa_Web/Project
https://github.com/Yaofang-Liu/Pusa-VidGen/blob/e99c3dcf866789a2db7fbe2686888ec398076a82/PusaV1/PusaV1.0_Report.pdfpaper
https://github.com/Yaofang-Liu/Pusa-VidGenYaofang-Liu/Pusa-VidGen
https://huggingface.co/RaphaelLiu/PusaV1RaphaelLiu/PusaV1
https://huggingface.co/Kijai/WanVideo_comfy/tree/main/PusaComfyUI(ComfyUI-WanVideoWrapper)向けのLora化モデル
https://www.reddit.com/r/StableDiffusion/comments/1m34y58/comment/n3tyxjp/?utm_source=share&utm_medium=mweb3x&utm_name=mweb3xcss&utm_term=1&utm_content=share_button2025/07/19時点ではComfyUI-WanVideoWrapperのみの対応
FVDM
動画のフレーム毎に違うノイズスケジュールを設定出来る
https://gyazo.com/c6888376d2a736c245704c32c914cb2e
WanT2Vの構造を丸ごと残したまま、タイムステップ埋め込みモジュールを追加しただけなのでT2Vモデルの性能を損なわない
Wan-I2VはT2Vの重み全部ファインチューニングする必要があったが、Pusa V1.0は埋め込みモジュール+αだけ学習するので学習コストが少なくて済む(1/200)
タイムステップをフレーム単位でベクトル化し、任意のフレーム条件付けを可能にする仕組みなため、image2videoだけでなく、FLF2VやVACEのExtensionのような時間軸を操るタスクも出来るようになる
関連
FVDM
なんとなく思い出したnomadoor.icon
RIFLEx